% ---------- Esercizio 1: set di dati es1_1.dat -----------------

% Carichiamo i dati ed immettiamo i dati nella matrice 
% data

% Verifichiamo l'ampiezza del campione
size(data)
%    500   2

%Estraiamo i dati delle colonne 1 e 2
datax=data(:,1);
datay=data(:,2);


% Calcoliamo gli indici di posizione media e mediana
[mean(datax), median(datax)]
% 2.0122    2.0449
[mean(datay), median(datay)]
%     3.9953    4.0255


% Calcoliamo il massimo ed il minimo
[max(datax), min(datax)]
%     5.0868   -0.7933
[max(datay), min(datay)]
%   8.2653   -0.7039



% Calcoliamo varianza, deviazione standard e differenze interquartili
% Nella prima colonna i dati relativi a datax e nella seconda quelli relativi a datay
[var(data); std(data);range(data);iqr(data)]
%   0.9746    2.0575
%   0.9872    1.4344
%   5.8802    8.9691
%   1.3205    1.9874


% Calcoliamo i percentili con passo 10
prctile(data, [10:10:100])
%    0.7723    2.2112
%    1.1889    2.7920
%    1.5352    3.2904
%    1.7773    3.6339
%    2.0449    4.0255
%    2.2763    4.3376
%    2.5494    4.7291
%    2.8066    5.2305
%    3.1917    5.7395
%    5.0868    8.2653

% Calcoliamo i quartili
prctile(data, [25:25:75])
%    1.3430    2.9954
%    2.0449    4.0255
%    2.6635    4.9828

% Calcoliamo Skewness e Curtosi
skewness(data)
%    0.0183   -0.0433
kurtosis(data)
%    3.1275    3.1764

% Calcoliamo la matrice di covarianza dei dati
cov(data)
%   0.9746   -0.9633
%  -0.9633    2.0575

% Disegnamo le scatterplot
scatter(datax,datay)

% I dati sembrano correlati negativamente
% Calcoliamo i coefficienti di correlazione dei dati
corrcoef(data)
%    1.0000   -0.6803
%   -0.6803    1.0000


% Calcoliamo la retta di regressione
% coefficienti della retta
c=polyfit(datax,datay,1)
%   -0.9884    5.9841

% Valutiamo i valori di datax sulla retta
z=polyval(c, datax);

% Valutiamo la bonta` dell'approssimazione lineare
% Calcoliamo il vettore dei residui e la sua norma2
r=z-datay;
norma2=norm(r) %=sqrt(sum(r.^2))
%   23.4856

ymedio=mean(datay);
DT=norm((datay-ymedio))^2 %=sum((int-intmedio).^2)  Devianza Totale
%  1.0267e+003
DS=norm(z-ymedio)^2 %=sum((z-intmedio).^2)        Devianza spiegata
%  475.1039
DR=norma2^2 %=sum(r.^2)                             Devianza residua
%  551.5730
R2=DS/DT      % e` buono quanto piu` e` prossimo a 1
%   0.4628


% ---------- Esercizio 1: set di dati es1_2.dat -----------------

% Carichiamo i dati ed immettiamo i dati nella matrice 
% data

% Verifichiamo l'ampiezza del campione
size(data)
%    500   2

%Estraiamo i dati delle colonne 1 e 2
datax=data(:,1);
datay=data(:,2);


% Calcoliamo gli indici di posizione media e mediana
[mean(datax), median(datax)]
%    6.9678    6.9127
[mean(datay), median(datay)]
%    3.0627    3.0035



% Calcoliamo il massimo ed il minimo
[max(datax), min(datax)]
%   13.3789    1.5384
[max(datay), min(datay)]
%    8.0677   -0.8931




% Calcoliamo varianza, deviazione standard e differenze interquartili
% Nella prima colonna i dati relativi a datax e nella seconda quelli relativi a datay
[var(data); std(data);range(data);iqr(data)]
%    2.9939    1.9923
%    1.7303    1.4115
%   11.8405    8.9607
%    2.3441    1.8830


% Calcoliamo i percentili con passo 10
prctile(data, [10:10:100])
%    4.7542    1.2648
%    5.5085    1.9200
%    6.0146    2.3226
%    6.4465    2.6912
%    6.9127    3.0035
%    7.4188    3.4048
%    7.8136    3.7690
%    8.3842    4.2942
%    9.1366    4.9676
%   13.3789    8.0677

% Calcoliamo i quartili
prctile(data, [25:25:75])
%    5.7985    2.1565
%    6.9127    3.0035
%    8.1426    4.0395


% Calcoliamo Skewness e Curtosi
skewness(data)
%    0.1920    0.0045
kurtosis(data)
%    3.3388    2.9628

% Calcoliamo la matrice di covarianza dei dati
cov(data)
%   2.9939    1.0204
%   1.0204    1.9923

% Disegnamo le scatterplot
scatter(datax,datay)

% I dati sembrano correlati positivamente
% Calcoliamo i coefficienti di correlazione dei dati
corrcoef(data)
%    1.0000    0.4178
%    0.4178    1.0000


% Calcoliamo la retta di regressione
% coefficienti della retta
c=polyfit(datax,datay,1)
%    0.3408    0.6878

% Valutiamo i valori di datax sulla retta
z=polyval(c, datax);

% Valutiamo la bonta` dell'approssimazione lineare
% Calcoliamo il vettore dei residui e la sua norma2
r=z-datay;
norma2=norm(r) %=sqrt(sum(r.^2))
%   28.6463

ymedio=mean(datay);
DT=norm((datay-ymedio))^2 %=sum((int-intmedio).^2)  Devianza Totale
%  994.1638
DS=norm(z-ymedio)^2 %=sum((z-intmedio).^2)        Devianza spiegata
%  173.5546
DR=norma2^2 %=sum(r.^2)                             Devianza residua
%  820.6092
R2=DS/DT      % e` buono quanto piu` e` prossimo a 1
%   0.1746


% ---------- Esercizio 2 -----------------

n=60;
p=1/6;

p1=binopdf(15,60,1/6)  %p1=P(X=15)
%    0.0309
p2=1-binocdf(14,60,1/6)  %p2=P(X>=15)
%    0.0648
p3=1-normcdf((15-n*p-0.5)/sqrt(n*p*(1-p)),0,1)  %p3=P(X>=15) con TCL
%    0.0595

% Per calcolare il numero minimo di lanci
% si tenga presente che
% 1-phi((15-n*p-0.5)/sqrt(n*p*(1-p)))>0.9
% e` equivalente a
% (15-n*p-0.5)/sqrt(n*p*(1-p))<q_0.1
% dov q e` la funzione dei quantili della normale standard

a=p;
b=norminv(0.1,0,1)*sqrt(p*(1-p));
c=-14.5;

n1=((-b+sqrt(b^2-4*a*c))/(2*a))^2
%   118.1483
% Pertanto il piu` piccolo numero di lanci e` 119
% Si noti che lo stesso risultato si sarebbe ottenuto con il comando
nmin=ceil(((-b+sqrt(b^2-4*a*c))/(2*a))^2)
%   119

% ---------- Esercizio 3: set di dati es3_1.dat -----------------

% La formula che restituisce gli estremi dell'intervallo
% di confidenza a livello alpha sono
% Varianza Nota
% xmax=xbar_n+sigma*q_((1+alpha)/2)/sqrt(n)
% xmin=xbar_n-sigma*q_((1+alpha)/2)/sqrt(n)
% Varianza incognita
% xmax=xbar_n+sigma*t(n-1)_((1+alpha)/2)/sqrt(n)
% xmin=xbar_n-sigma*t(n-1)_((1+alpha)/2)/sqrt(n)

n=80;
xbar_n=mean(dati)
%   95.6159
sigma=sqrt(var(dati))
%   44.5326

alpha=.9;
xmax=xbar_n+sigma*norminv((1+alpha)/2,0,1)/sqrt(n)
%  103.8054
xmin=xbar_n-sigma*norminv((1+alpha)/2,0,1)/sqrt(n)
%   87.4263

% La semiampiezza e`
delta=sigma*norminv((1+alpha)/2,0,1)/sqrt(n);

alpha1=.95;
nmin=ceil(sigma^2*norminv((1+alpha1)/2,0,1)^2/delta^2)
%  114

xmax=xbar_n+sigma*tinv((1+alpha)/2,n-1)/sqrt(n)
%  103.9026
xmin=xbar_n-sigma*tinv((1+alpha)/2,n-1)/sqrt(n)
%   87.3291

% La semiampiezza e`
delta=sigma*tinv((1+alpha)/2,n-1)/sqrt(n);

i=n+1;
% Calcoliamo il minimo valore di n con un ciclo while
while tinv((1+alpha1)/2,i-1)/sqrt(i)>tinv((1+alpha)/2,n-1)/sqrt(n)
i=i+1;
end

i
%  114


% ---------- Esercizio 3: set di dati es3_2.dat -----------------

% La formula che restituisce gli estremi dell'intervallo
% di confidenza a livello alpha sono
% Varianza Nota
% xmax=xbar_n+sigma*q_((1+alpha)/2)/sqrt(n)
% xmin=xbar_n-sigma*q_((1+alpha)/2)/sqrt(n)
% Varianza incognita
% xmax=xbar_n+sigma*t(n-1)_((1+alpha)/2)/sqrt(n)
% xmin=xbar_n-sigma*t(n-1)_((1+alpha)/2)/sqrt(n)

n=80;
xbar_n=mean(dati)
%      52.4979
sigma=sqrt(var(dati))
%   34.7672

alpha=.9;
xmax=xbar_n+sigma*norminv((1+alpha)/2,0,1)/sqrt(n)
%   58.8916
xmin=xbar_n-sigma*norminv((1+alpha)/2,0,1)/sqrt(n)
%   46.1042

% La semiampiezza e`
delta=sigma*norminv((1+alpha)/2,0,1)/sqrt(n);

alpha1=.95;
nmin=ceil(sigma^2*norminv((1+alpha1)/2,0,1)^2/delta^2)
%  114

xmax=xbar_n+sigma*tinv((1+alpha)/2,n-1)/sqrt(n)
%   58.9675
xmin=xbar_n-sigma*tinv((1+alpha)/2,n-1)/sqrt(n)
%   46.0283

% La semiampiezza e`
delta=sigma*tinv((1+alpha)/2,n-1)/sqrt(n);

i=n+1;
% Calcoliamo il minimo valore di n con un ciclo while
while tinv((1+alpha1)/2,i-1)/sqrt(i)>tinv((1+alpha)/2,n-1)/sqrt(n)
i=i+1;
end

i
%  114